AFE - Fundamentos e Aplicações
Análise de Dados Ambientais
Universidade Estadual de Feira de Santana (UEFS)
ANÁLISE FATORIAL EXPLORATÓRIA
O QUE É
A análise fatorial exploratória (AFE) é um conjunto de técnicas estatísticas amplamente utilizadas nas pesquisas em Psicologia
Durante sua execução, diversas decisões precisam ser tomadas a fim de se obter uma estrutura fatorial adequada
Diferenças entre análise fatorial exploratória e análise de componentes principais
Retenção e rotação fatorial
Tamanho da amostra ideal
Variância explicada
Confiabilidade da solução fatorial
ANÁLISE FATORIAL EXPLORATÓRIA
O QUE VOCÊ PRECISA ENTENDER
ANÁLISE FATORIAL EXPLORATÓRIA
Objetivo da AFE
ANÁLISE FATORIAL EXPLORATÓRIA
Objetivo da AFE
| Eu me sinto exausto só de pensar em trabalhar | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|
| Não tenho tido paciência para lidar com as pessoas no meu trabalho | 1 | 2 | 3 | 4 | 5 |
| Sinto que meu trabalho não tem valor | 1 | 2 | 3 | 4 | 5 |
| Cada dia de trabalho parece uma tortura pra mim | 1 | 2 | 3 | 4 | 5 |
| Tenho me tornado frio com as pessoas as quais preciso lidar no meu trabalho | 1 | 2 | 3 | 4 | 5 |
| Meu trabalho me realiza | 1 | 2 | 3 | 4 | 5 |
| Após um dia de trabalho, não tenho ânimo para mais nada | 1 | 2 | 3 | 4 | 5 |
| Por vezes, chego a sentir raiva das pessoas do meu trabalho | 1 | 2 | 3 | 4 | 5 |
| Meu trabalho complementa positivamente a minha vida | 1 | 2 | 3 | 4 | 5 |
ANÁLISE FATORIAL EXPLORATÓRIA
Objetivo da AFE
Define-se AFE como um conjunto de técnicas multivariadas que tem como objetivo encontrar a estrutura subjacente em uma matriz de dados e determinar o número e a natureza das variáveis latentes (fatores) que melhor representam um conjunto de variáveis observadas (Brown, 2006).
As variáveis observadas “pertencem” a um mesmo fator quando, e se, elas partilham uma variância em comum (i.e., são influenciadas pelo mesmo construto subjacente) (Brown, 2006).
Fator é uma variável latente (e.g., autoestima) que influencia mais de uma variável observada
ANÁLISE FATORIAL EXPLORATÓRIA
Objetivo da AFE
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
A AFE e a ACP são duas técnicas que têm por objetivo reduzir um determinado número de itens a um menor número de variáveis
A ACP foi por muito tempo o método de redução de dados mais utilizado nas pesquisas em Psicologia
Cálculos computacionais da ACP mais simples, mais rápidos e mais baratos → Amplo uso
ACP é, ainda hoje, o método padrão de redução de dados em muitos dos principais programas estatísticos (por exemplo, SPSS e SAS)
ANÁLISE FATORIAL
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
AFEs geram fatores
ACPs geram componentes
A diferença entre componentes e fatores está relacionada à forma como os itens são retidos.
Ambos os métodos de redução de dados assumem que a variância de uma variável é composta por três aspectos: variância específica; variância comum; e variância de erro.
ANÁLISE FATORIAL EXPLORATÓRIA
Retirado de Damásio (2012).
específica:
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
Variância
variância
Porção de
é
do item que não com
nenhuma
outra
compartilhada variável.
Variância** ****comum:**** **Variância que é compartilhada entre todos os itens que
determinado fator ou
compõem componente.
Variância** ****de**** ****erro:**** **Parcela do item não explicada pelo componente ou fator
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
Compo-
nente
x1
x2
x3
x4
Os indicadores que criam o(s) componente(s)
Exemplos:
Nível socioeconômico
Escolaridade
Renda
Bens materiais
Emprego (Classificação ISEI)
Qualidade de um supermercado
Preços
Atendimento dos funcionários
Espaço físico
Estacionamento
Segurança da região
Variedade de produtos (…)
Modelo Formativo
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
Fator
Modelo Reflexivo
x1
x2
x3
x4
Depressão
O traço latente que gera o comportamento
Tristeza Frequente
Falta de sentido na vida
Choro constante
Apatia
Problemas de sono
Problemas de alimentação
Baixa Autoestima
Ideação suicida
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
*Exemplos:** *Depressão
Tristeza Frequente Baixa Autoestima
Falta de sentido na vida Problemas de alimentação
Apatia
Problemas de sono Choro constante Ideação suicida
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
Fator
Modelo Reflexivo
x1
x2
x3
x4
O traço latente que gera o comportamento
Depressão
Tristeza Frequente
Falta de sentido na vida
Choro constante
Apatia
Problemas de sono
Problemas de alimentação
Baixa Autoestima
Ideação suicida
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
Compo
x2
x3
x4
Componentes Principais Modelo Formativo
Fator / Traço Latente
x1
x2
x3
x4
Análise Fatorial Modelo Reflexivo
ANÁLISE FATORIAL EXPLORATÓRIA
Análises** Fatoriais**** ****Exploratórias**** ****vs**** ****Análise**** ****de**** ****Componentes**** ****Principais**
Em termos práticos…
ANÁLISE FATORIAL EXPLORATÓRIA
Kaiser** ****Meyer-****Olkmin**** ****(KMO)**
Índice de adequação da amostra
Avalia se a matriz de dados é passível de fatoração
Sugere a proporção de variância dos itens que pode estar sendo explicada por uma variável latente (Lorenzo-Seva, Timmerman, & Kiers, 2011).
Valores variam de 0 a 1.
0,5 e < 0,7 são considerados medíocres;
0,7 e < 0,8 são considerados bons;
0,8 e 0,9 são considerados ótimos e excelentes. (Hutcheson & Sofroniou, 1999)
ANÁLISE FATORIAL EXPLORATÓRIA
Teste** ****de**** ****esfericidade**** ****de ****Barlett**
Avalia em que medida a matriz de (co)variância é similar a uma matriz-identidade (i.e., os elementos da diagonal principal tem valor igual a um, e os demais elementos da matriz são aproximadamente zero, ou seja, não apresentam correlações entre si, Field, 2005).
Valores do teste de esfericidade de Bartlett com níveis de significância *p** *< 0,05
indicam que a matriz é fatorável (Tabachnick & Fidell, 2007),
ANÁLISE FATORIAL EXPLORATÓRIA
Retenção** ****Fatorial**
Uma das mais importantes decisões a ser tomada
Uma extração inadequada impossibilita a interpretação dos resultados de maneira apropriada
(Hayton, Allen & Scarpello, 2004).
ANÁLISE FATORIAL EXPLORATÓRIA
Retenção** ****Fatorial**
Péssimos métodos de retenção fatorial
*Eigenvalue** *> 1 Ótimos métodos de retenção
Análise Paralela
Método Hull
BIC
ANÁLISE FATORIAL EXPLORATÓRIA
Eigenvalue** ****>**** ****1**
Possivelmente um dos critérios mais utilizados até os dias atuais
Cada fator retido apresenta um eigenvalue que se relaciona ao total de variância explicada por este fator
A soma total dos eigenvalues é sempre igual ao número de itens utilizados na análise (utilizando uma escala de 29 itens, a soma dos 29 eigenvalues é igual a 29)
Fator com eigenvalue < 1 apresenta um total de variância explicada menor do que um único item.
ANÁLISE FATORIAL EXPLORATÓRIA
Eigenvalue** ****>**** ****1**
Apesar da simplicidade, da objetividade e do amplo uso desse critério, há forte consenso na literatura de
que seus resultados são imprecisos
(Costello & Osbourne, 2005; Floyd & Widaman; 1995; Patil e cols., 2008; Reise, Waller &Comrey, 2000).
Critério do eigenvalue > 1 superestimou em 36% dos casos o número de fatores retidos.
(Costello & Osborne, 2005)
O critério do eigenvalue > 1 tende a superestimar o número de fatores a ser retido devido ao erro amostral
(Laher, 2010; Ledesma & ValeroMora, 2007).
O critério de Kaiser-Guttman como método de retenção fatorial não é recomendado
(Patil e cols., 2008; Velicer e cols., 2000).
ANÁLISE FATORIAL EXPLORATÓRIA
Análise** ****Paralela**
A AP é um procedimento estatístico de simulação Monte-Carlo que compara os eigenvalues dos dados originais, com eigenvalues gerados por matrizes aleatórias construídas no processo de simulação.
A base aleatória possui:
John Horn
(1928 - 2006)
ANÁLISE FATORIAL EXPLORATÓRIA
Análise** ****Paralela**
Implementação Clássica (Horn, 1965)
Baseada em Eigenvalues
Simulação Monte-Carlo Implementação Otimizada (Timmerman & Lorenzo-Seva, 2011)
Baseada em variância explicada dos fatores
Permutação aleatória dos valores amostrais (Bootstrapping)
ANÁLISE FATORIAL EXPLORATÓRIA
Análise** ****Paralela**
Os resultados das matrizes aleatórias são contrastados com os dados originais e passa-se a reter apenas os fatores dos dados originais que sejam ‘mais fortes’ que dos dados aleatórios
MÉTODO HULL
ANÁLISE FATORIAL EXPLORATÓRIA
Método** ****Hull**
Tem apresentado grande potencial enquanto método de retenção fatorial.
Determina a amplitude de fatores a serem avaliados (Análise Paralela);
Avalia os índices de adequação de ajuste de todas as soluções fatoriais, bem como os graus de liberdade
de cada um dos modelos.
(Ceuleman & Kiers, 2006; Ceulemans, Timmerman & Kiers, 2010; Lorenzo-Seva e cols., 2011).
MÉTODO BIC DIMENSIONALITY TEST
ANÁLISE FATORIAL EXPLORATÓRIA
BIC
Schwarz´s Bayesian Information Criterion (BIC; Schwarz, 1978).
Índice de ajuste desenvolvido especificamente para escolha de modelos (model selection framework)
Busca avaliar o modelo mais próximo à estrutura verdadeira *(quasi-true** *model; Kullback-Leibler information; )
Foco em modelos parcimoniosos
Estrutura com menor valor de BIC é selecionada
ANÁLISE FATORIAL EXPLORATÓRIA
ROTAÇÃO** ****DE**** FATORES**
ANÁLISE FATORIAL EXPLORATÓRIA
ROTAÇÃO** ****ORTOGONAL**
Assumem que os fatores extraídos são independentes uns dos outros (i.e, não apresentam correlações entre si; *r** *= 0).
(Schmitt & Sass, 2011).
ANÁLISE FATORIAL EXPLORATÓRIA
ROTAÇÃO** ****OBLÍQUA**
ANÁLISE FATORIAL EXPLORATÓRIA
Aspecto de divergência de opiniões e controvérsias na literatura científica, principalmente no que diz respeito ao número mínimo de sujeitos necessários.
Gorsuch (1983) e Hair et al. (2005)
*N** *> 100 sujeitos e um número mínimo de cinco respondentes por item. Cattell (1978)
N < 250, 3 a 6 respondentes por item Everitt (1975)
10 respostas para cada item avaliado Não houve experimentos de simulação que corroborassem ou refutassem estas informações
(MacCallum, Widaman, Zhang, & Hong, 1999)
ANÁLISE FATORIAL EXPLORATÓRIA
O** ****que**** se**** ****sabe**** ****hoje:**
Amostras grandes tende a fornecer resultados mais precisos, diminuindo o efeito do erro amostral
Fornecem resultados mais próximos ao índice populacional, tanto no que se refere à estrutura fatorial, quanto à carga fatorial e à comunalidade dos itens
(MacCallum e colaboradores, 1999).
Porém, em relação ao tamanho** ****mínimo**…
Barrett e Kline (1981) demonstraram que soluções fatoriais estáveis foram encontradas com um número variando de 1,2 a 3 respondentes por item
Resultados semelhantes foram encontrados por MacCallum e colaboradores (1999).
O que está por trás é mais a qualidade do instrumento do que o N
ANÁLISE FATORIAL EXPLORATÓRIA
O grau em que um fator é claramente representado por um número suficiente de itens e pela qualidade (nível) das suas cargas fatoriais e comunalidades.
ANÁLISE FATORIAL EXPLORATÓRIA
ANÁLISE FATORIAL EXPLORATÓRIA
m construto hipotético
VARIÂNCIA** ****EXPLICADA**
da alta? O que é baixa?
paz de estimar 100% da variância de u
interpreta o número?
(Peterson, 2000)
ANÁLISE FATORIAL EXPLORATÓRIA
FIDEDIGNIDADE** (**Confiabilidade, Precisão, Consistência interna)
ANÁLISE FATORIAL EXPLORATÓRIA
FIDEDIGNIDADE** (**Confiabilidade, Precisão, Consistência interna)
Quanto mais próximo for o padrão de respostas dos itens de um determinado fator, maior será a fidedignidade.
Fidedignidade não garante validade “Os escores do teste podem ser relativamente livres de erros de mensuração, e ainda assim, não serem úteis como base para as inferências que precisamos fazer”
(Urbina, 2007, p. 159)
Validade
Fidedignidade
ANÁLISE FATORIAL EXPLORATÓRIA
Coeficiente** ****Alpha**** ****(Cronbach,**** ****1951)**
O coeficiente alfa de Cronbach é uma forma de estimar a confiabilidade de um questionário aplicado em uma pesquisa.
Mede a correlação entre respostas em um questionário, apresentando uma estimativa de
correlação média entre as perguntas.
ANÁLISE FATORIAL EXPLORATÓRIA
Coeficiente** ****Alpha**** ****(Cronbach,**** ****1951)**
Pressuposto da tau-equivalência: todos os itens tem a mesma importância para o fator (Sijstma, 2009)
Coeficiente alpha puxa a fidedignidade para baixo (Green & Yang, 2009)
Alternativas
ANÁLISE FATORIAL EXPLORATÓRIA
VAMOS** ****A**** ****PRÁTICA**
Na** ****descrição**** ****da**** ****aula**** ****você**** ****encontra**
REFERÊNCIAS
Claeskens G, Hjort NL. Model Selection and Model Averaging. Cambridge: University Press; 2008
Green S. B., Yang Y. (2009a). Commentary on coefficient alpha: a cautionary tale. Psychometrika 74, 121–135. 10.1007/s11336-008-9098-4
McDonald R. (1999). Test Theory: a Unified Treatment. Mahwah, NJ: Lawrence Erlbaum Associates.
Neath, A. A., & Cavanaugh, J. E. (2011). The Bayesian information criterion: background, derivation, and applications. Wiley Interdisciplinary Reviews: Computational Statistics, 4(2), 199–203. doi:10.1002/wics.199
Raykov T. (1997). Scale reliability, cronbach’s coefficient alpha, and violations of essential tau- equivalence with fixed congeneric
components. Multivariate Behavioral Research, 32, 329–353. doi:10.1207/s15327906mbr3204_2
Schwarz G. (1978). Estimating the dimension of a model. Annual Statistics, 6, 461–464.
Sijtsma K. (2009). On the use, the misuse, and the very limited usefulness of Cronbach’s alpha. Psychometrika 74, 107–120. 10.1007/s11336- 008-9101-0
Timmerman, M. E., & Lorenzo-Seva, U. (2011). Dimensionality assessment of ordered polytomous items with parallel analysis. Psychological
Methods, 16(2), 209-220. doi:https://dx.doi. org/10.1037/a0023353
Obrigado!
Luiz Diego Vidal Santos
Universidade Estadual de Feira de Santana (UEFS)
UEFS — Análise de Dados Ambientais